火眼金睛看这里!
微信公共账号:微软研究院
微软在计算机视觉图像分类和3D扫描方面取得新突破
你一定已经对微软可以自动识别图像上的物体并为其添加准确描述的“黑科技”有所耳闻,但取得这些研究的进展并不是一朝一夕的事。
事实上,这项跨学科的研究结合了计算机视觉、机器学习和人工智能以及计算机系统与网络在内的众多领域的知识,而这仅仅是微软对于正在蓬勃发展的“深度学习”领域的一部分研究成果。多年来,微软始终致力于为地球上的每个人和每个组织提供更好的服务、实现更多的价值,在深度学习技术方面所取得的进展正是践行这一宗旨的基础。
深度学习同样也是本周在美国波士顿举行的第28届IEEE计算机视觉与模式识别大会(28th IEEEConference on Computer Vision and Pattern Recognition ,以下简称“CVPR”)上所展示的众多研究成果的基础。
本届大会最新的研究突破包括了对计算机视觉图像识别速度的显著提升,以及可以提高通过Kinect等传感器3D扫描图像的清晰度的全新算法等。
微软亚洲研究院主管研究员孙剑和首席研究员何恺明在他们名为“限定计算条件下的卷积神经网络研究”(ConvolutionalNeural Networks at Constrained Time Cost)的论文中,阐述了如何解决不断提高图像分类精度时所消耗的时间问题。他们提出了一个比现有快速模型更精准、耗时更少,且适合广泛使用的新模型。
此外,孙剑和何恺明也和西安交通大学的研究员们合作,在题为“非线性卷积网络的一种高效逼近方法”(Efficientand Accurate Approximations of Nonlinear Convolutional Networks)的论文中,提出了在保证错误率低于1%的前提下,将非线性卷积神经网络的速度提升4倍的新方法。
此次CVPR大会上,微软研究员还展示了在3D数字化和使用Kinect等传感器进行3D扫描方面的新进展。
在论文Large-Scale and Drift-FreeSurface Reconstruction中,微软研究员Jonathan Taylor、首席研究员Andrew Fitzgibbon 和 ShahramIzadi 与波洛尼亚大学(University of Bologna)的研究员们合作,介绍了一种可以让大规模3D扫描计算在分钟级而不是小时级内完成的方法,它还可以实现在光线极弱甚至完全黑暗的条件下的3D扫描。
“正如我们在CVPR上展示的那样,Kinect使得3D扫描在动态或大规模场景下的模型捕捉成为了可能。” Izadi如是说。
微软研究员也展示了显著提高对移动物体扫描效果的新研究。在论文3DScanning Deformable Objects with a Single RGBD Sensor 中,研究员Fitzgibbon和Izadi与北卡罗来纳州大学教堂山分校( University ofNorth Carolina at Chapel Hill) 的研究员们合作研发了一套只需要使用Kinect传感器、不严格限制用户或相机设备运动的全新扫描方法。
“自然而然地,这些用于识别的模型未来将使深度学习这一新兴科技领域更好地应用于实际生活,让计算机在丰富的视觉世界中更好地理解用户。”微软研究员ShahramIzadi说道。
了解更多本届CVPR大会展示的研究成果,请点击“阅读原文”。
了解中英实时语音翻译助手,请回复“Skype Translator”
观看钢铁侠主演小罗伯特唐尼携手微软送义肢视频,请回复“钢铁侠”
下载Windows Phone最专业最贴心的天气顾问APP,请回复“小鱼天气”
如果觉得好,就鼓励一下作者吧!